查看原文
其他

因果推断的实证革命,搞前沿计量都需要阅读的大作

计量经济圈 计量经济圈 2022-05-11

欢迎投稿(荐稿)计量经济圈,计量相关都行

箱:econometrics666@sina.cn

copyrights@计量经济圈(ID: econometrics666);转载请注明出处。招募翻译小组,详情间文章后面哦。


我受邀为著名的TSEstudent杂志写篇文章。借此机会,我将关注点放在讨论这些问题上:实证主义经济学的现在和将来,以及为了提高实证经济学的研究我们可以做的事情。

 

40年以来,经济学实证工作取得了巨大的进展。在最近的一篇论文中,JoshAngrist和其合作者表明,经济学实证研究的相关研究在重要期刊上发表的比例,从1980年的约30%上升到今天的50%以上。这是一个非常重要且可喜的趋势。在本文中,我想评估总结一下经济学实证研究的主要进展,并展望即将面临的挑战。


 

我认为,经济学实证革命的主要成就是因果推断。因果推断,即严格甄选出干预效应的能力,能使我们可以准确地去验证一些理论,也能使我们适当合理地去评估一些公共政策。实证革命将注意力聚焦在研究设计的可信度上:所研究数据的哪些特征有助于识别出利益因果效应?

 

随着实证革命之风的袭来,经济学的实证方面可以说已经与理论方面形成并驾齐驱的态势了。作为经济学的两个支柱,他们相得益彰还能够互相配合,从而使得经济学能像成一门成熟的社会科学一样发展着,错误的理论逐渐被从中剔除掉;也使得经济学能像一个真正的社会工程学一样,终止那些无效的社会政策,但强化那些经得起实证检验的社会政策。

 

在我看来,与该领域中的最著名的理论成果相比,实证革命的成果是非常突出的。我认为,在经济实证革命中的这几位贡献者,很显然将会在未来几年里获得诺贝尔奖:Orley Ashenfelter, Josh Angrist, David Card, Alan Krueger, Don Rubin, GuidoImbens.

 

这里只是提一些重要成就(其他不再赘述):

 

·微金融,曾经被认为是促进发展的杀手锏,但事实证明它似乎并没能有效缓解贫困状况(实际上最近的一些结果表明我们可能已经误解了(夸大了)小额信贷的影响,因为它们的运行规模比以前的实验所能看到的规模更大),一个更加有效的方法似乎更起作用。

 

·与中国的贸易,对发达国家的工人产生了重大影响,甚至影响了最近的美国大选,因为设想地场景是裁员会把工人推进火坑,毕竟雇主在当地拥有绝对占优的雇佣垄断能力,可实证检验的结果是其对最低工资和移民的影响,并没那么明显。

 

·永久收入假说似乎并不成立,乘数总是大于1,货币政策具有实际的影响性。

 

•   需求曲线一路下滑(需求下降到商品中包含吉芬商品)。

 

•   肯尼亚贸易商勾结,合并垄断引起价格上调,竞争减少,贷款市场存在逆向选择的问题。

 

•    如何分配污染排放许可权对于最终的均衡并无影响。

 

•    微小的推动力可能有非常小的或非常大的影响。

 

•预期效用不足以解释某些风险下的决策。

 

我发现很神奇的一点是:实证结果对经济学基础设想的支持力度有多大,其推翻力度就有多大!例如市场运行、理性的个体。

 

有时个体表现出理性,但是有时他们的行为又显得不合理。有时市场能够起作用,但有时它又失灵了。我想我们将会看到越来越多的理论试图剔除掉一些可能重要或不重要的场景。

 

经验革命也带来了一种新型的研究方法论。经济学家的实证工具包现在已经构建了5种类型的因果推理工具:实验室/对照实验; 随机对照试验(RCTs); 自然实验; 观测方法和结构模型。除了理论计量经济学取得令人印象深刻的成就之外,我们现在在实证因果推断方面的方法论上也的进展也令人瞩目:

 

•实验室实验是否接近现实生活行为?

 

•RCT是否会影响人们的行为?我们都知道,询问人们问题会改变他们随后的决定,并且处于试验中的人群和常规模式下的人群是不同的。

 

•观察方法是否重现RCT的结果? Jasmin Fliegner,Roland Rathelot和我最近的研究表明答案是否定的。

 

•   结构模型能够预测改革的结果吗?Dan McFadden用理论表明,在旧金山地铁的出现时,随机效用模型能够几近完美地预测到该新产品的市场份额。由IsisDurrmeyer,PhilippeFévrier和Xavierd'Haultfoeuille共同研究发现,主力IO模型无法预测法国“综合税制”的引入对汽车市场份额的影响。 Parag Pathak和彭石最近也表示,学校选择模型在预测波士顿分配算法改革的结果这方面,做得很好。

 

但即将面临的挑战必须要加以解决。我对此前景非常乐观,因为已经看到了学界对此的反应。我认为我们应对这些挑战的反应越敏捷,我们在公众眼中的可信度越高,我们就能取得越快的进展。

 

我所看到的第一个挑战是聚焦在因果关系上的。科学始于观察,发现那些需要得到合理解释的一些事实。在过去的几十年中,最有影响力的实证研究之一是托马斯·皮凯蒂与其合作者共同进行的,这个研究发现了世界各国不平等的经济增长。观察新的事实也应该成为经济学经实证工具箱的一部分。

 

我在经济学实证研究中看到的第二个也是最重要的挑战是发表偏差。当研究人员和编辑仅发表具有统计意义的结果时,就会出现发表偏差。当结果不精确时,发表偏差会导致出现严重高估的结果偏差。发表偏差一直困扰着整个研究领域,如癌症研究和心理学,现在都面临可重复危机。JohnIoannidis和同伴最近发表的一篇论文衡量了实证经济学中发表偏误的程度,并发现这种偏误程度非常大:“实证经济学研究中近80%的效应被夸大了二倍; 有三分之一研究的所给出的效应被鼓吹甚至到了到四倍或更多。”这是一个相当严重的问题。例如,用于评估政策的统计生活价值大约被高估了2倍,从而做出了错误的政策决策。

 

第三个挑战是精确性:实证经济学中的大多数结果都是非常不准确的。我喜欢使用信噪比的概念来说明这一点。5%的结果几乎没有统计意义,信噪比仅为0.5,意味着信号的噪声是信号的两倍。这样的结果与很多不同的真实效果(从非常小到非常大)兼容。但事情实际上比这更糟糕。Ioannidis和合作者估计,实证经济学的中位数权重为18%,这意味着信噪比为0.26,即相较于作者给出的那部分解释,实证研究中实际上包含着4倍于此的噪音。我把这个问题归结为对统计显着性的专注,而忽视了实际的噪声采样。

 

1. 编辑必须采取措施,鼓励描述性工作,遏制发表偏差。这需要:

 

·沟渠p值和统计显着性,并关注采样噪声,例如通过置信区间测量。置信区间明确了真实估计的不确定性。以“估计影响为x±y”的形式呈现摘要中的抽样噪声。

 

·发布无效结果(即不显著的结果),它们与重要结果一样,甚至比重要结果更有趣且信息量更丰富。提供更精确的结果。

 

·使用一种给定的范式,写出能够从实证论文中得到什么结果的明确指导方针。

 

·要求预先注册研究,即使是非实验性研究。预注册会阻止有选择性的搜索和筛选。

 

·鼓励使用盲数据分析。这个由物理学家发明的工具使您能够在变换后的数据上编写代码,并且只在真实数据上运行一次,从而防止有选择性地筛选。

 

·发布复制和Meta分析(对结果进行严格总结,包括检验发表偏差的测试)。

 

2. 研究人员必须共同努力,以获得更加精确的结果。这需要:

 

·评估我们的现状:使用Meta分析已发表的结果,以评估经济学中的哪些理论命题在何种程度上已经得到验证或驳斥。

 

·了解仍然存在的关键性挑战:经济学中10或100个最重要的实证问题是什么?按照大卫希尔伯特的例子说明数学世纪的23个问题。

 

·将所有专业的努力集中在试图解决这些挑战上,尤其是通过进行非常大且非常精确的关键实验。这里想到的例子是物理学家联合起来为获得资助和建立CERN和LIGO / VIRGO实验所需的测试,用来测试标准模型的关键预测。

 

3.通过把实证结果放在一个与理论命题同等的位置,从而我们能够以一个实证科学的范式来教授经济学。

 

这能够帮助我们更好地,识别出建立在实证基础上的那些理论命题的相同点;了解现在仍然存在但未能解决的挑战;帮助学生学习科学方法,并将其融入激动人心的科学进步之旅。在这方面,还有很多的事情需要我们共同努力。我们能看到这场革命,并为此做出贡献真是令人激动!


原文标题:"TheEmpirical Revolution in Economics: Taking Stock andLooking Ahead"


翻译组招募信息


工作内容:需要一颗细致的心,将选取好的外文文章翻译成流畅的中文。如果你对自己外语水平有信心的朋友欢迎加入翻译小组。只要你翻译二篇指定的经济类外文(非学术刊物),你就可以直接加入计量经济圈社群,无需其他任何附带条件,只要质量还能够得到保证。报名,请直接致信计量经济圈公邮(在前面)。


写在后面:各位圈友,咱们的计量经济圈社群里面资料和计量咨询都很多,希望大家能够积极加入咱们这个大家庭戳这里)。我们已经邀请社群里的圈友建立了微信群与圈圈对话,进去之后一定要看“群公告”,不然接收不了群息。


以下这个人严重侵犯计量经济圈知识产权,至少附上来源是计量经济圈。如果再不停止侵犯权益,我们将通过维权平台对你的行为进行干预。


帮点击一下下面的小广告,谢谢支持!


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存